实例教程3:非正态分布的数据,怎么统计分析呢?
自从小咖同学在“实例教程:手把手教你计算样本量”中露了一手,大家被他的才气深深地折服
小飞看了9月23日医咖会微信推送的“降糖药物利拉鲁肽,还能治疗心衰吗?”的研究(FIGHT研究)后[1],不明白研究方法II中的Wilcoxon秩和检验到底是什么,于是来找小咖讨论。
小咖:这是一种非参数检验方法。
小咖:平时我们常用的t检验、卡方检验、方差分析等方法都要求样本服从特定的分布(比如t检验要求样本服从正态分布),这些方法被称为参数检验方法。但有些数据并不符合参数检验的要求,最常见的情况是数据不符合正态分布,这时可以使用非参数检验的方法。
非参数检验有很多种, Wilcoxon秩和检验就是其中一种。
小咖:好吧。某医生为了评价A药对绝经后妇女的骨质疏松症是否有效,将30名绝经后妇女随机分为两组,干预组研究对象15例,给予A药+乳酸钙治疗;对照组15例,仅给予乳酸钙治疗。24周之后观察两组L2-4骨密度的改善率。数据如下图:
两组骨密度改善率(%)
小咖:很聪明,给你满分。接下来给你演示一下用SPSS 22.0怎么操作。
(1)数据录入SPSS
(2)分析→非参数检验→旧对话框→2个独立样本
(3)选项设置
①将骨密度测量值BMD送入检测变量列表(T)→②将Group送入分组变量(G)→③定义组(D): 组1、组2中分别输入Group变量的赋值→④检验类型选择Mann-Whitney U→继续→确定
(4)结果解读
SPSS首先给出了两组的编秩情况列表。
小咖:所谓的秩,英文叫Rank,你可以理解为等级、排名的意思。秩和检验的做法是这样的:将原始数据由小到大排队,然后给每个原始数据一个秩次。最后,检验两组之间秩次的差异是否有统计学意义,而不是检验原始数据。
小咖:嗯,很正确。上面这个表格,就是编秩后的汇总,干预组(Group 1)的总秩次为293.5,平均秩次为19.57;对照组(Group 2)的总秩次为171.5,平均秩次为11.43。
小咖:这个忘了说了,编秩时还有个原则:当原始数据相同但在不同组时,秩次取平均值(如对照组12、干预组6的秩次分别为17.5、17.5);当原始数据相同并且在同组时,秩次顺序排列(如对照组14、15的秩次分别为21、22)。(详见下表红色的数据)
好的,明白了秩和检验的原理之后,咱们再来看看检验结果。
SPSS给出了Mann-Whitney U统计量、Wilcxon W 统计量、Z值、近似法计算的P值和确切概率法计算的P值。一般情况下,我们使用近似法计算的P值。(如果你想搞明白如何选择近似法计算的P值和确切概率法计算的P值,以及二者有什么差异,可以给我们留言哦,这里我就不讲了。)
小咖:可以这么描写,当然你也可以修改一下啊。
干预组骨密度改善率的平均值为3.66%,中位数为3.60%;对照组骨密度改善率的平均值为1.71%,中位数为1.71%。采用Mann-Whitney U检验:Z=-2.531,P=0.011,结合实际数据,可以认为干预组骨密度改善率高于对照组骨密度改善率,差异有统计学意义。
小咖:哈哈哈,我就知道聪明的你一定会提出这个问题的。是这样的,Wilcoxon检验和Mann-Whitney U检验方法没有实质上的差别,检验原理和结果也完全等价,只是在计算统计量时略有差别。SPSS中没有Wilcoxon的模块,SAS中有。两种方法可以认为是等价的,在统计分析时,写清楚用哪种方法就行。
小咖:对头。
小咖:
proc npar1way wilcoxon data=bmd;
class Group;
var BMD;
run;
小咖:......
实例教程精彩回顾:
1. 生存资料的Cox回归分析
2. 手把手教你计算样本量
推荐阅读文献
1. Margulies KB, et al. Effects of Liraglutide on Clinical Stability Among Patients With Advanced Heart Failure and Reduced Ejection Fraction: A Randomized Clinical Trial. JAMA. 2016 Aug 2;316:500-8.
medieco-ykh
对方法学感兴趣?快快关注“医咖会”
点击左下角“阅读原文”,了解医咖会既往推送的内容。